یک الگوریتم جدید برای بهبود اکتشاف اقلام تکرار شونده با استفاده از معیارهای شباهت در پایگاه داده های کمی

پایان نامه
چکیده

پایگاه داده باینری در حقیقت یک حالت خاصی از پایگاه داده کمی است که شامل متغیرهای صریح صفر و یک است، لذا اکتشاف در پایگاه داده های کمی بسیار مشکل تر از اکتشاف در پایگاه داده های باینری بوده و از طرف دیگر قدرت گویای متغیرهای کمی نسبت به متغیرهای باینری، منجر به تولید دانش گران بهاتر نسبت به پایگاه داده های باینری می شود. به عنوان یک مزیت و برتری الگوریتم پیشنهادی index_qfi نسبت به الگوریتم های جسته جو شده در این زمینه، می توان گفت که این الگوریتم بر روی داده های واقعی سازمان ها به خوبی عمل می کند و این با انجام یک بررسی موردی از این الگوریتم پیشنهادی بر روی پایگاه داده های سازمان تأمین اجتماعی، به عنوان یک پایگاه داده واقعی نشان داده می شود. بررسی مزیت الگوریتم index_qfi نسبت به برترین و مشهورترین الگوریتم های موجود در نرم افزارهای داده کاوی مانند weka و clementine انجام شده و پس از اجرای الگوریتم های apriori، predictiveaprior، tertius و filteredassociator از تکنیک استنتاج قانون در نرم افزار weka، مشخص گردید که در نگارش weka 3.4.12 هیچ یک از الگوریتم های مذکور قابلیت اجرا بر روی داده های کمی را ندارند. همچنین الگوریتم های مربوط به تکنیک استنتاج قانون که در نرم افزار spss clementine 12 پیاده سازی شده اند، شامل apriori، gri و carma نیز بر روی این مجموعه داده ها مورد بررسی قرار گرفت و مشخص شد که الگوریتم های مذکور نیز بر روی داده های کمی عمل نمی کنند. جهت مقایسه قوانین تولید شده توسط الگوریتم پیشنهادی در پایگاه داده دارویی سازمان تأمین اجتماعی، تولید قوانین با ایجاد مدل از الگوریتم های درخت های تصمیم شامل chaid، c&r tree و c5.0 به همراه تکنولوژی boosting در نرم افزار spss clementine 12 بر روی این مجموعه داده انجام شد و علی رغم محدودیت این نرم افزار در پذیرش نوع های داده ای و زمان اجرای تقریباً دو برابر نسبت به الگوریتم index_qfi ، اختلاف ناچیز قوانین تولید شده، مشخص گردید.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یک رهیافت جدید برای جایگاه یابی مسائل چند مدی با استفاده از الگوریتم بهبود یافته جهش قورباغه

: مسأله جایگاه یکی از روش‌های مهم برای بهینه سازی مسایل چند مدی است. بیشتر روش‌های موجود در مسأله جایگاه نیاز به تعیین دقیقی از پارامترهای جایگاه به منظور عملکرد بهتر دارد. مشکل اصلی الگوریتم­های ابتکاری در حل مسائل چند بعدی قدرت همگرایی آنها به یک جواب (عموماً بهینه فرا محلی) است. الگوریتم جهش قورباغه، از جمله الگوریتم‌های ابتکاری است که در سال­های اخیر تا کنون نسخه‌ای از آن برای حل مسائل چند م...

متن کامل

یک روش جدید شناسایی نوسان توان برای استفاده در رله دیستانس با استفاده از داده های PMU

در این مقاله روشی جدید براساس استفاده از داده های PMU برای تشخیص نوسان توان و جلوگیری از عملکرد ناصحیح رله های دیستانس ارائه شده است. نوسان توان همیشه یکی از مسائل مهم در پایداری شبکه های قدرت بوده است. در سال های اخیر بدلیل بزرگتر شدن شبکه های قدرت و عملی شدن بازار برق، نوسان توان های بزرگی در شبکه های مختلف در سراسر جهان رخ داده است که باعث بروز خاموشی هایی بزرگ شده اند. با ورود تجهیزات جدید...

متن کامل

انتخاب دید جهت ذخیره‌سازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی

پایگاه داده تحلیلی حجم زیادی از داده‌ها که در سیستم‌های تصمیم‌گیرنده و گزارش‌گیر مورد استفاده قرار می‌گیرد را ذخیره می‌کند. در این سیستم‌ها سرعت پاسخ‌گویی به پرس‌وجوها به علت حجم زیاد داده‌های ذخیره‌شده، پایین است. از آن‌جایی که این سیستم‌ها عموماً مورد استفاده مدیران ارشد در سازمان‌های مختلف هستند، درنتیجه افزایش سرعت در این سیستم‌ها حائز اهمیت است. یکی از روش‌های افزایش سرعت، ذخیره دیدها جهت پ...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

بهبود الگوریتم انتخاب دید در پایگاه داده‌‌ تحلیلی با استفاده از یافتن پرس‌ وجوهای پرتکرار

A data warehouse is a source for storing historical data to support decision making. Usually analytic queries take much time. To solve response time problem it should be materialized some views to answer all queries in minimum response time. There are many solutions for view selection problems. The most appropriate solution for view selection is materializing frequent queries. Previously posed ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده فناوری اطلاعات

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023